人全基因组重测序(Whole-genome sequencing,WGS)是基于人基因组参考序列对个体或群体进行全基因组测序(resequencing),并在个体或群体水平筛选出基因组范围内的遗传变异,实现基因型多样性分析、遗传进化分析,致病和易感性基因,单基因病筛查以及癌症筛查等的筛选。随着二代测序(Illumina)技术的发展与普及,全基因组重测序已成为人类遗传学、转化医学和群体进化领域最为迅速而有效的方法之一,可更全面地挖掘全基因组范围内的序列差异和结构变异,包括单碱基突变、插入缺失变异、拷贝数变异和结构变异(SNV、SNP、InDel、CNV、SV),在全基因组水平上扫描并检测与表型差异、疾病、进化等相关的突变位点。
人类基因组上外显子和非翻译区(UTRs)占总序列的1-2%,但却包含多达85%疾病相关的基因突变。全外显子组测序(Whole Exome Sequencing,WES)就是利用序列捕获技术或者靶向技术将全基因组外显子区域DNA捕获富集后进行高通量测序,外显子只占基因组的比例低,全外显子组测序只需针对外显子区域的基因序列测序,只测少量数据即可实现更高的测序深度,变异检测更加准确,也更加简便、经济、高效。
那么人全基因组重测序和全外显子测序有什么相同点和不同点呢?
全血样本、PBMC(外周血单核细胞)、新鲜冻存组织、FFPE样本均可用于全基因组重测序和全外显子测序;不同之处在于,全基因组重测序文库构建的DNA起始量在500ng,而全外显子测序的DNA起始量为100ng,且浓度不低于10ng/ul。全外显子测序一般更加适合有些许降解或者DNA量较低的样品,比如FFPE样品。除了以上的样品的差别之外,人全基因组重测序与外显子测序技术相比,文库构建技术流程简单而成熟,更易操作。人全基因组重测序一般推荐多少X测序深度?人全基因组重测序深度根据研究目的、样本量而定。一般测序深度至少30X,用来检测胚系变异,比如遗传病的研究。在肿瘤突变研究中,由于需要根据测序的深度和频率计算肿瘤细胞分数(Cancer Cell Fraction,CCF),深度越高,分辨率也相应的越高,此时建议深度测序不低于50X,最好100X,需要在测序深度样本量以及预算之间做一个平衡。全外显子测序有不同的捕获平台(Nimblegen、Illumina,Agilent,Twist等),捕获区域在30Mb-60Mb之间,捕获特异性也有区别,比如Nimblegen捕获平台捕获特异性50-60%。Agilent捕获特异性60-70%。以安捷伦V6捕获平台计算,12Gb左右的数据就可以得到100X的有效测序深度(这里的深度不是针对全基因组,而是针对有效捕获的区域)。可用于遗传病相关的变异研究。对于肿瘤异质性研究,由于肿瘤的异质性,肿瘤内部有很多亚克隆,有些亚克隆的占比很低,应用更高高深度测序可以更快、更经济地检测出普通测序深度难以发现的体细胞突变。此时测序深度在200X-500X为宜。与外显子测序相比,全基因组重测序可全面挖掘各种遗传变异,除了SNV和InDel之外,还包括CNV、SV,特别是一些大的结构变异,在全基因组范围内寻找与疾病或某功能相关的位点。外显子测序检测SNV,InDel变异,但是一般不会检测SV变异和CNV变异。但在癌症研究中,利用癌组织和癌旁组织对照,可以检测CNV。全基因组重测序和全外显子测序所用的变异检测和注释的软件基本一致,比对参考基因组均为BWA,SNV和InDel检测均用GATK,肿瘤克隆进化有自己的一套特异的检测体系,这里暂且不表。此外,全基因组重测序可发掘新的变异位点,而全外的探针是依据已经完成的基因组序列设计,探针序列固定,对于特定的人群拥有的特异的变异是无法检测出来的。全基因组重测序检测的SNV、InDel、SV、CNV有不同的验证方法:1) SNPs 和InDel可以通过PCR 扩增包含该SNP 位点的区段,并进行一代测序(sanger);或采用SNP 分型检测的方法验证,比如KASP验证。
2) CNVs 可通过Real-time PCR 对存在拷贝数变异的片段进行扩增,并根据CT 值估算不同个
体的拷贝数变化倍数。
3) 小的SVs 可通过PCR 扩增和测序辨别,而大的SVs 则需要通过亚显微方法发现,如FISH
等。小片段的InDel,可通过PCR扩增,利用Sanger法测序进行验证。